~今天要分享的是「隨機森林介紹」~
隨機森林是一種監督式機器學習方式,可用於解決迴歸跟分類的問題。
隨機森林可以說是決策樹的延伸,因為它是由多個決策樹建立而成的,隨機森林比起決策樹具有更好的預測準確性跟泛化能力,因為隨機森林使用的是隨機採樣,這有助於減少模型過擬合,另外,它還具有可以處理高維度資料且不用事先做特徵工程(特徵挑選)的優點。
[考試愛考觀念]
隨機森林的預測結果是採投票(分類問題)或平均(回歸問題)的方式來決定,以分類男生和女生的問題為例,隨機森林的每棵樹可能分別在判斷頭髮的長短、有沒有鬍子、有沒有喉結等特徵(重點:每顆樹之間是沒有關聯的!),之後再依據每棵樹判斷的結果來預測最終結果為何,假設有3棵樹認為是女生,2顆樹認為是男生,由於大多數樹的預測結果是女生,那麼最後隨機森林的預測結果就會是女生。